【IT168 专稿】随着数据中心的快速发展,其用于IT设备的能耗和散热上的成本增长也同样快速。据不完全统计,原先购买成本和运维成本的比值是7:3,而这一比率已经逐渐变成5:5,甚至更低。因此,如何有效降低能耗支出,已经成为数据中心管理者工作的重中之重。
上一期英特尔支招文章中我们从散热功耗和计算效率两方面,结合英特尔自身经验谈了如何帮助数据中心节约能耗。本期我们将以英特尔数据中心管理软件(DCM)为核心,阐述该平台是如何在管理层面帮助系统减少系统功耗的。
DCM的四大基本功能
英特尔数据中心管理平台(Intel Data Center Manager, DCM)是一款监控、管理数据中心的机架和服务器组电、热等能耗的软件技术。据英特尔亚太研发有限公司总经理梁兆柱博士介绍,DCM当前版本主要包含的功能是:内置式智能启发引擎可在不影响工作性能的同时降低服务机组能耗上限;利用英特尔节点管理器(Intel Node Manager)技术来管理节点的电、热能耗;可作为软件开发工具包(SDK),通过网络服务应用程序接口(WSDL API)集成到ISV和系统集成商现有的管理软件产品中。
据笔者采访了解,DCM数据中心管理平台可以通过与至强5500/5600系列处理器以及相关芯片组对数据中心里各服务器节点的负载情况做动态监控,并根据计算优先级配给电力资源,控制功耗。这主要体现在以下四个方面:
①根据服务器的优先级别动态分配电源:比如针对主要服务型服务器,可以调高它们的优先级别,以优先保证其的用电需求。
②使用实际的和观察到的数据,重新估计和设计数据中心的制冷系统和电源供给:可以先根据服务器的物理位置和功能进行分组,然后根据监控得来的数据(目前DCM最多能存储过去一年的服务器功耗和环境温度数据),对每组服务器设置具体的用电配额和制冷策略。
③通过分析供电和工作量,诊断是否有效使用机架空间:比较实际电耗和根据服务器标称功率而做的电源分配安排的大小。
④观察数据中心供电系统和高温异常等情况,并及时提醒用户:为数据中心各个服务器组,配置了相应的用电配额和温度策略,一旦组用电或者温度超过了设定阀值,相应的组就会采用允许范围内的最小供电,同时发出异常情况告警通知(比如短信、邮件等),从而让数据中心管理人员能够在最短的时间内处理相应的问题,从而避免了服务器烧坏或者过热宕机等情况。
百度测试智能功耗控制:每机柜节省400瓦
如果以上四点还没有帮助大家了解DCM的强大功耗管理功能的话,那么再举个小例子:DCM可以自动监视基于至强平台服务器的电能消耗和进口温度,如果服务器温度突破一个极限,时钟速度将自动下降;另一方面,DCM还可以集中各个服务器组中的策略,从而实现以相当复杂的方式回应数据中心的温度和电能条件;如果必要,它还可以用应用程序服务水平协议来覆盖电能和温度条件。
在百度与英特尔合作的智能功耗控制技术研究中,我们可以看到英特尔DCM处于总控位置,自动化的进行监控、分析、实时调整数据中心负载和功耗。根据百度测试的实验数据,在获得相同性能的前提下,使用英特尔数据中心管理平台(DCM)可以将系统功耗降低70瓦左右(一个节点)。也因此,使用DCM可以有效为机柜节约电力消耗(电信运营商对每个机柜有2.2KW的功率限制)。
如果按照通常每个机架服务器的功耗在400瓦左右,一个机柜最多可以安放5台服务器,而对于一个2U尺寸的服务器来说,20U的机架只能放5台服务器(10U)极大的浪费了机房空间。而使用DCM功耗管理之后,每台服务器可以节省70余瓦,5台服务器就可以节约出350~400瓦电力,进而使得该机柜可以多部署一台服务器。